python处理word文档文字重复 |
您所在的位置:网站首页 › word 重复字提示 › python处理word文档文字重复 |
之前介绍了一个Python包 openpyxl ,用于处理 Excel ;而对于 Word 文本时同样也有对应的 Python库 Python-docx,在日常办公中,如果需要处理多个 word 文本,且操作步骤都是重复单调的,我想这个库就可以帮到你 在了解 Python-docx 常用函数之前,需要知道 在 Python-docx 各命令所对应 word 各部件,下图所示,Document 指的是 word 文档; paragraph 对应段落; run 对应 一句话中的各个字段,样式调整时,一般面向的操作对象都是逐字段进行; 1,安装 Python-docx 通过 pip 工具即可进行安装,在命令行中输入 pip install Python-docx 即可 2,创建或打开 Document Python-docx 导入包时是以 docx 命令存在的,与 Opencv 的 Python 版本导入方法相似;创建文件、打开文件以 Document() 命令操作,这里操作时需要注意几个点:1,Document() 命令是基于默认”模板“创建一个空白文档,随后可对文档进行编辑操作,最后没有用 save() 函数存储的话,文档将伴随程序结束同内存一起 2,Document(path) 命令表示打开一个本地已经存在的 docx 文件,path 表示存放目录若不存在则程序报错; 下面代码中,创建了一个空白 docx,赋值给 document from docx import Document document = Document() 3,加入一段落 段落作为 docx 文档正文的主要成分,那怎样在创建好的 Document 中加入一段话呢?官方给出了两种方式 1,在文档后面插入 这种方法是比较常见且简单的,命令如下 paragraph = document.add_paragraph('Lorem ipsum dolor sit amet.') 方法中将创建好的段落引用指向 paragraph ,表明了光标的位置,后面的一些操作可以借助 paragraph 引用变量来作为定位操作 2ÿ |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |